1
突破顺序计算的瓶颈
AI032Lesson 10
00:00

“免费午餐”时代的终结

数十年来,开发者曾享受着“顺序计算天花板”的红利——一个 登纳德缩放定律 确保每一代新芯片都能带来更高的时钟频率的时代。但如今我们已触及 功耗墙。性能不再取决于频率;而是取决于 并发性。为了继续前进,我们必须运用 计算思维 来弥合抽象 数值方法 与现代 并行执行模型之间的鸿沟。

精度与性能的权衡

将一个 领域问题 (如分子动力学)从一个 多核主机 迁移到 CUDA设备 不仅仅是语法上的改变;更是一种 问题分解的转变。当我们进行并行化时,常常会改变操作的顺序。由于浮点数运算不具备结合律,我们面临一个权衡: 浮点数精度与准确性。并行计算的结果可能在数学上是正确的,但在数值上可能与串行版本产生偏差。

顺序计算天花板时钟频率限制并行高速公路CUDA 吞吐量计算思维之桥
main.py
TERMINALbash — 80x24
> Ready. Click "Run" to execute.
>